Ein Kostenmodell der parallelen Anfragebearbeitung in Shared-Nothing-Datenbanksystemen

نویسنده

  • Robert Marek
چکیده

Zunehmend komplexe und datenintensive Benutzeranfragen auf Datenbanken verlangen parallele Verarbeitungsansätze. Vor allem Datenbanksysteme der Architekturklasse Shared-Nothing bieten derzeit eine geeignete Basis für die parallele Anfragebearbeitung. Im Hinblick auf den interaktiven Charakter komplexer Datenbankanfragen ist eine Verkürzung der Antwortzeit das vorrangige Leistungsziel paralleler Datenbanksysteme. Im Falle der heute dominanten mengenorientierten relationalen Anfragesprachen erlaubt vor allem Intra-OperatorParallelität eine effektive Antwortzeitverkürzung. Die Antwortzeit kann jedoch nicht durch zunehmende Parallelisierung beliebig verkürzt werden. Wird ein gewisser Parallelisierungsgrad überschritten, tritt vielmehr wieder eine Verschlechterung der Antwortzeit ein. Dieser Effekt liegt einerseits in einem beschränkten Parallelisierungspotential, andererseits in mit zunehmendem Parallelisierungsgrad steigenden Kooperationsund Kommunikationskosten begründet. Die Bestimmung des optimalen Parallelisierungsgrades ist daher von besonderer Bedeutung. Aus diesem Grunde haben wir ein analytisches Kostenmodell entwickelt, das die Antwortzeitentwicklung von Datenbankanfragen in Abhängigkeit vom Grad der Parallelisierung beschreibt. Anhand dieses Modells können wir grundsätzliche Trade-Offs der parallelen Anfragebearbeitung untersuchen. Weiterhin kann das Kostenmodell zur Unterstützung des Optimierers bei der Anfrageparallelisierung sowie zur Bestimmung einer geeigneten Datenverteilung genutzt werden. Das Kostenmodell wurde mit Hilfe begleitender Simulationsversuche zur parallelen Bearbeitung von Anfragen validiert.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Indexallokation in Parallelen Datenbanksystemen

Die effiziente Nutzung von Zugriffsstrukturen ist eine wichtige Voraussetzung für die performante Durchführung von Datenbankanfragen. Die in Parallelen Datenbanksystemen vom Typ Shared-Nothing übliche, durch die Allokationsstrategie für Relationen weitgehend vorgegebene Indexallokation führt oftmals zu unnötigen I/O-, Verarbeitungsund Kommunikationskosten. Parallele Shared-Disk Datenbanksysteme...

متن کامل

Formbasierte Suche nach komplementären 3D-Oberflächen in einer Protein-Datenbank

Zusammenfassung: Die Komplementarität der 3D-Oberflächen von Proteinen ist neben den physikochemischen Eigenschaften ein entscheidendes Kriterium dafür, ob und an welchen Stellen zwei Proteine miteinander wechselwirken, d.h. docken, können. Anders als in Geo-Datenbanksystemen, die Anfragen nach Objekten mit einer gegebenen räumlichen Lage und Ausdehnung unterstützen, werden deshalb beim Protein...

متن کامل

Eine Speicher- und Zugriffsarchitektur zur effizienten Anfragebearbeitung in Geo-Datenbanksystemen

Zusammenfassung Im Bereich geographischer Datenbanksysteme liegen aufgrund der Komplexität der Objekte und Anfragen sowie der extrem großen Datenvolumina besondere Anforderungen an die Speicherund Zugriffsarchitektur in bezug auf eine effiziente Anfragebearbeitung vor. In den letzten Jahren wurden eine Reihe von Konzepten, wie räumliche Indexstrukturen, Approximationen, Objektzerlegung und Mehr...

متن کامل

Kalibrierung von Kostenmodellen für föderierte DSMS

Bei verteilten Datenstromsystemen ist es ebenso wie bei verteilten Datenbanksystemen für die Verteilung von Anfragen entscheidend, die zu erwartenden Kosten schätzen zu können. Bei der Kostenschätzung mit Kostenmodellen müssen die Parameter für jedes System und jeden Operator ausgemessen werden. In dieser Arbeit wird ein black-box-Verfahren vorgestellt, mit dem es möglich ist, für beliebige Dat...

متن کامل

Verhinderung von Phantomen in XML-Datenbanksystemen mit wertbasierten Achsensperren

Die parallele und transaktionssichere Verarbeitung von operationalen Daten in XML-Datenbanksystemen erfordert ein XML-Datenmodell mit zugeschnittenen Speicherungsstrukturen und Synchronisationsalgorithmen, um einen hohen Transaktionsdurchsatz zu erzielen. Zur Gewährleistung der höchsten Isolationsstufe serializable reicht es nicht aus, die während der Anfrageverarbeitung gelesenen XML-Knoten un...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 1995